这项研究旨在实现两个目标:第一个目标是策划一个大型且信息丰富的数据集,其中包含有关球员的行动和位置的关键和简洁的摘要,以及在专业和NCAA中排球的来回旅行模式Div-i室内排球游戏。尽管几项先前的研究旨在为其他运动创建类似的数据集(例如羽毛球和足球),但尚未实现为室内排球创建这样的数据集。第二个目标是引入排球描述性语言,以充分描述游戏中的集会过程并将语言应用于我们的数据集。基于精选的数据集和我们的描述性运动语言,我们使用我们的数据集介绍了三项用于自动化排球行动和战术分析的任务:(1)排球拉力赛预测,旨在预测集会的结果,并帮助球员和教练改善决策制定决策在实践中,(2)设置类型和命中类型预测,以帮助教练和球员更有效地为游戏做准备,以及(3)排球策略和进攻区统计,以提供高级排球统计数据,并帮助教练了解游戏和对手的策略更好的。我们进行了案例研究,以展示实验结果如何为排球分析社区提供见解。此外,基于现实世界数据的实验评估为我们的数据集和语言的未来研究和应用建立了基准。这项研究弥合了室内排球场与计算机科学之间的差距。
translated by 谷歌翻译
In this paper, we introduce a novel variation of model-agnostic meta-learning, where an extra multiplicative parameter is introduced in the inner-loop adaptation. Our variation creates a shortcut in the parameter space for the inner-loop adaptation and increases model expressivity in a highly controllable manner. We show both theoretically and numerically that our variation alleviates the problem of conflicting gradients and improves training dynamics. We conduct experiments on 3 distinctive problems, including a toy classification problem for threshold comparison, a regression problem for wavelet transform, and a classification problem on MNIST. We also discuss ways to generalize our method to a broader class of problems.
translated by 谷歌翻译
我们定义了一个新颖的神经符号框架,论证奖励学习,该奖励学习将基于偏好的论点与现有方法结合了从人类反馈中加强学习的方法。我们的方法通过概括人类的偏好,减轻用户的负担并增加奖励模型的鲁棒性来改善先前的工作。我们通过许多实验证明了这一点。
translated by 谷歌翻译
卡尔曼过滤器通过以平均值和协方差的形式存储对州估计的高斯描述来运行。平方根的卡尔曼滤波器不是直接存储和操纵协方差矩阵,而仅形成并更新协方差矩阵的三角形矩阵平方根。所得算法在数值上比传统的卡尔曼过滤器更稳定,从而使工作精度的双倍受益。本文提出了平方根卡尔曼滤波器的公式,该滤波器利用QR分解以极大地简化了所得算法。
translated by 谷歌翻译
新型NLP单词嵌入和深度学习技术的爆炸引起了潜在应用的重大努力。这些方向之一是金融部门。尽管在GPT和BERT等最先进的模型中完成了很多工作,但对于这些方法在接受预训练后通过微调的表现以及有关敏感的信息的效果相对较少,相对较少的工作。它们的参数是。我们研究了预先训练的GPT-2和BERT模型转移神经体系结构的性能和灵敏度。我们基于冻结变压器层,批处理大小和学习率测试微调性能。我们发现BERT的参数对微调的随机性过敏,并且在这种实践中GPT-2更加稳定。同样很明显,GPT-2和BERT的较早层包含应维护的基本单词模式信息。
translated by 谷歌翻译
抓握是通过在一组触点上施加力和扭矩来挑选对象的过程。深度学习方法的最新进展允许在机器人对象抓地力方面快速进步。我们在过去十年中系统地调查了出版物,特别感兴趣使用最终效果姿势的所有6度自由度抓住对象。我们的综述发现了四种用于机器人抓钩的常见方法:基于抽样的方法,直接回归,强化学习和示例方法。此外,我们发现了围绕抓握的两种“支持方法”,这些方法使用深入学习来支持抓握过程,形状近似和负担能力。我们已经将本系统评论(85篇论文)中发现的出版物提炼为十个关键要点,我们认为对未来的机器人抓握和操纵研究至关重要。该调查的在线版本可从https://rhys-newbury.github.io/projects/6dof/获得
translated by 谷歌翻译
物体之间的碰撞检测对于机器人系统的模拟,控制和学习至关重要。但是,现有的碰撞检测例程本质上是非差异的,从而限制了它们在基于优化的算法中的实用性。在这项工作中,我们提出了一个完全可区分的碰撞检测框架,该框架的原因是一组可复合和高度表达的凸原始形状之间的距离。这是通过将碰撞检测问题制定为凸优化问题来实现的,该问题旨在在有相交之前找到要应用于每个对象的最小均匀缩放率。优化问题是完全可区分的,并且能够返回每个对象上的碰撞检测状态以及接触点。
translated by 谷歌翻译
碰撞检测在机器人系统的模拟,控制和学习中起重要作用。但是,对于对象的配置,没有现有的方法是可区分的,极大地限制了可以在碰撞检测顶部构建的算法。在这项工作中,我们通过将这些问题作为可区分的凸二次程序程序提出,提出了胶囊和填充多边形之间的一组可区分的碰撞检测算法。所得算法能够返回一个接近值,以指示是否发生了碰撞以及对象之间的最接近点,所有对象都是可区分的。结果,它们可以在其他基于梯度的优化方法中可靠地使用,包括轨迹优化,状态估计和强化学习方法。
translated by 谷歌翻译
我们研究了如何将高分辨率触觉传感器与视觉和深度传感结合使用,以改善掌握稳定性预测。在模拟高分辨率触觉传感的最新进展,尤其是触觉模拟器,使我们能够评估如何结合感应方式训练神经网络。借助训练大型神经网络所需的大量数据,机器人模拟器提供了一种快速自动化数据收集过程的方法。我们通过消融研究扩展现有工作,并增加了从YCB基准组中获取的一组对象。我们的结果表明,尽管视觉,深度和触觉感测的组合为已知对象提供了最佳预测结果,但该网络未能推广到未知对象。我们的工作还解决了触觉模拟中机器人抓握的现有问题以及如何克服它们。
translated by 谷歌翻译
我们提出了一个用于机器人应用专业的非凸轨迹优化问题的新求解器。Calipso或Conic增强Lagrangian内点求解器,结合了几种约束数值优化的策略,以本机处理二阶锥体和互补性约束。它可靠地解决了具有挑战性的运动规划问题,其中包括影响和库仑摩擦的接触式图形,受锥形约束的推力限制以及受国家触发的约束,而通用非线性编程溶液(如Snopt和iPopt)无法融合。此外,Calipso支持有关问题数据的有效分化,从而实现了双层优化应用程序,例如自动调整反馈策略。求解器的可靠收敛性在操纵,运动和航空航天域的一系列问题上得到了证明。可以使用该求解器的开源实现。
translated by 谷歌翻译